查看原文
其他

学习隐私计算的前景如何?对于隐私计算关注者的一点建议

The following article is from 秃顶的码农 Author 杜宝坤


写在前面:经常会有同学来问隐私计算学习和前景相关的问题,在毕业季来临的前夕、也是全民关注高考的今天,分享宝坤老师的这篇文章供大家参考。欢迎大家在评论区、社群里交流讨论,有好的想法、学习笔记等欢迎投稿,还有其他想问的问题也欢迎留言。


祝各位高考学子旗开得胜!心想事成!



一、背景



▲前景


最近在知乎以及微信有很多有志于从事隐私计算的学生以及出入职场的同学找到我,咨询如何学习隐私计算、隐私计算的前景如何等等。我大体罗列了下,大致有以下几种问题:


1.隐私计算技术到底是否值得学习,是否是镜花水月,是否有真实的落地场景。

2.学习隐私计算的前景如何?

3.隐私计算技术应该如何学习?

4.隐私计算未来会如何?




▲从业者的困惑


针对这些情况,我在知乎、微信等渠道和很多朋友交流过,未来让更多的从业者和有志从业者看到,能够帮助到更多的人,所以写了这篇文章,和大家一起分享下。



二、 隐私计算的前景




▲隐私计算的复杂性


各国政府机构和一些组织机构已经清醒的意识到隐私数据的严重性,从政策法规层面进行了规范,一下列举下最近几年各国关于数据隐私的一些重大的举措与案例:


  • 「GDPR」是 (The European) General Data Protection Regulation 的缩写,翻译成中文是:「通用数据保护条例」,是欧盟议会和欧盟理事会在 2016 年 4 月通过,在 2018 年 5 月开始强制实施的规定。

  • 欧盟和美国政策制定者强调加强隐私技术是2021年的共同优先事项;

  • 据报道,2021年7月,美国统一法律委员会(ULC)投票通过了《统一个人数据保护法》( UPDPA)。UPDPA是数据隐私法案范本,旨在为各州提供一个模板,以向自己的立法机构介绍,并最终作为具有约束力的法律。在最终修订后,UPDPA将于2022年1月前提交州立法机构。

  • 2021年6月《中华人民共和国数据安全法》(以下称《数据安全法》)历经三审三读,于2021年6月10日经第十三届全国人民代表大会常务委员会第二十九次会议通过。在二审稿基础上删除了1条,增加了3条,正式公布的文本共7章55条,将于2021年9月1日起正式实施。

  • 2021年7月10日,国家互联网信息办公室发布《网络安全审查办法(修订草案征求意见稿)》公开征求意见的通知,第六条中指出 “掌握超过100万用户个人信息的运营者赴国外上市,必须向网络安全审查办公室申报网络安全审查。” 由此可以看出,整治隐私保护、数据安全问题的决心。

  • 经过三次审议,十三届全国人大常委会第三十次会议表决通过了《中华人民共和国个人信息保护法》,并与2021年11月1日起施行。确立个人信息保护原则、规范处理活动保障权益、禁止“大数据杀熟”规范自动化决策、严格保护敏感个人信息、赋予个人充分权利等。


基于数据隐私的重要性,各大互联网具体纷纷加大对于隐私计算的投入,确保在未来的赛道中脱颖而出,不落于人,并且保持先发的领先优势。


  • FaceBook利用隐私增强技术(PETs)在投放广告时保护隐私,应用MPC、联邦学习、差分隐私等方式进行相关的全链路保障。探索全同态加密技术的演进,期望通过端到端的加密,实现“加密数据的运算替换明文数据的运算,达到同样计算结果“的密保,解决数据隐私问题。

  • Google利用本地化差分隐私保护技术从Chrome浏览器每天采集超过1400万用户行为统计数据。Google推出的一项旨在保护用户隐私的颠覆性新技术FLoC,本质也是一种联邦学习的技术。

  • 2020年,苹果手机在其IOS14里,每个想要使用这些ID设备号的应用都需要在用户首次使用时向用户询问授权,用户可以选择“允许追踪”和“禁止追踪”,如果用户希望为广告商提供更多数据以获得更精准的广告推送,则需要明确授权允许,进一步保护用户隐私。

  • 2021年6月24日,在微软正式推出了 Windows 11 操作系统之后,同时发布了必须满足 Windows 的最低硬件要求,即WIT(Wintel Trust),其中指定了必须包含TPM可信计算硬件及软件,即不包含TPM硬件的设备不能使用Windows 11。

  • 2020年,京东与字节跳动在营销领域进行联邦学习合作,成功实现联邦学习平台的落地,并且基于业务进行联邦建模,双方业务大涨,效果显著。

  • 阿里达摩院发布了2022十大科技趋势,全域隐私计算强势上榜。并且阿里云、阿里妈妈与蚂蚁等都投入重兵布局隐私计算。

  • 百度研究院发布了2022年的十大科技趋势预测,其中提到,「隐私计算技术备受关注,将成为数据价值释放的突破口和构建信任的基础设施」



▲前途光明

所以从整个政策层面与行业巨头的布局方面,可以清晰的看出隐私计算行业未来的重要性,未来一片光明。所以对于隐私计算的前景,大家真的不必过多担心。



三、技术方向




▲技术演进路线


2016 年发布的《隐私计算研究范畴及发展趋势》正式提出“隐私计算”一词,并将隐私计算定义为:“面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。”


隐私计算本质上是在保护数据隐私的前提下,解决数据流通、数据应用等数据服务问题,在保证数据提供方不泄露原始数据的前提下,对数据进行计算、分析与建模的一系列信息技术,涵盖数据的产生、存储、计算、应用、销毁等信息流转的全生命周期。


说得更通俗一些,就是在保证数据安全的前提下,让数据可以自由流通或共享,消除数据孤岛问题,从而释放更大的数据价值,提升生产效率,推进产业创新。


隐私计算的理念包括:”数据可用不可见,数据不动模型动“、“数据可用不可见,数据可控可计量”、“不共享数据,而是共享数据价值”等这门技术是门综合性非常强的领域,涉及到众多方向,比如密码学、数学、大数据、实时计算、高性能计算、分布式、传统机器学习框架与算法,深度学习框架与算法等等,整体技术非常复杂,对于从业者的要求极高。


根据目前市场上隐私计算的主要相关技术特性,可分为四大方向与五大基座


  • 方向一:安全多方计算

  • 方向二:差分隐私

  • 方向三:基于硬件的可信执行环境

  • 方向四:联邦学习

  • 基座一:隐私计算基础组件,包含同态加密、秘密分享、不经意传输、混淆电路等;

  • 基座二:传统的安全,包含网络安全、主机安全、破解与反破解(横向联邦需要端侧计算的能力,需要安全防护)

  • 基座三:传统机器学习与深度学习的算法与框架能力

  • 基座四:分布式、高并发、大数据、实时计算等传统技术;

  • 基座五:传统学科知识,例如数学、统计学习、密码学等;



四、发展模式建议 




▲进步的图像结果


这些基座技术都在隐私计算的四大方向中有所使用,是整个隐私计算体系的基石。但是普通人很难对所有的领域都有所涉猎,建议掌握一至两门自己擅长的领域,对于其他的领域逐步的熟悉与理解,技术都是相通的,一些思路与理念可以复用。


隐私计算是新兴的领域,有很多难题需要解决,只有掌握了充足的知识储备,才能在这个隐私计算的盛宴中绽放出绚丽的色彩。


  • 机器学习从业者(联邦学习方向):建议机器学习从业者,掌握下密码学的相关知识,并且掌握算法的底层原理,才能从底层实现中进行隐私加密的保障。

  • 密码学人士:如果不是从联邦学习方向,基本无需掌握ML技术,可以拓展下基座三的能力。


其实无论走什么方向,都要做精,本着吃苦的精神,脚踏实地,一步一步坚实的走过每个山头,到最后回首一望,所过之路,皆是坦途!与诸君共勉!



END
往期推荐:




隐私计算头条周刊(5.29-6.4)


未来会出现伟大的隐私计算科技公司吗?


未来十年,将会有95%的企业采用隐私计算技术


公开课|数据安全流通技术解—隐私计算


开放隐私计算社区征稿啦!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存